Cohérence des données de bases RDF en évolution constante

نویسندگان

  • Pierre Maillot
  • Thomas Raimbault
  • David Genest
چکیده

Résumé. Le maintien de la qualité et de la fiabilité de bases de connaissances RDF du Web Sémantique est un problème courant. De nombreuses propositions pour l’intégration de « bonnes » données ont été faites, se basant soit sur les ontologies de ces bases, soit sur des méta-données additionnelles. Dans cet article, nous proposons une approche originale, basée exclusivement sur l’étude des données de la base. Le principe est de déterminer si les modifications apportées par la mise à jour candidate rendent la partie ciblée de la base plus similaire – selon certains critères – à d’autres parties existantes dans la base. La mise à jour est considérée cohérente avec cette base et peut être appliquée.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Détection et Représentation des changements dans les sources de données RDF

Résumé : De nombreuses sources de données RDF sont en évolution constante que ce soit au niveau des données ou du vocabulaire utilisé (ontologie). De nombreuses tâches d’intégration sont impactées par ces modifications qu’il s’agisse de synchroniser des données locales avec une source de données externe ou d’effectuer des traitements plus complexes comme le liage ou la fusion de données. Dans c...

متن کامل

Mesurer les usages d'Internet

Résumé. Nous rendons compte d'une démarche mise en place pour construire une représentation fine des usages d'internet et de leur évolution, en procédant à du traitement secondaire de données de trafic, provenant de panels représentatifs d'internautes. Après avoir présenté les caractéristiques des cohortes étudiées et les différents modes d'enrichissement des données de trafic mis en place, nou...

متن کامل

Contributions à la réplication de données dans les systèmes distribués à grande échelle. (Contributions to data replication in large-scale distributed systems)

Data replication is a key mechanism for building a reliable and efficient data ma-nagement system. Indeed, by keeping several replicas for each piece of data, it is possible toimprove durability. Furthermore, well-placed copies reduce data access time. However, havingmultiple copies for a single piece of data creates consistency problems when the data is up-dated. Over the last ...

متن کامل

Détection de clefs pour l'interconnexion et le nettoyage de jeux de données

Résumé : Cet article propose une méthode d’analyse de jeux de données du Web publiés en RDF basée sur les dépendances de clefs. Ce type particulier de dépendances fonctionnelles, largement étudié dans la théorie des bases de données, permet d’évaluer si un ensemble de propriétés constitue une clef pour l’ensemble de données considéré. Si c’est le cas, il n’y aura alors pas deux instances posséd...

متن کامل

Just-Right Consistency: reconciling availability and safety

By the CAP Theorem, a distributed data storage system can ensure either Consistency under Partition (CP) or Availability under Partition (AP), but not both. This has led to a split between CP databases, in which updates are synchronous, and AP databases, where they are asynchronous. However, there is no inherent reason to treat all updates identically: simply, the system should be as available ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2015